AI资讯新闻榜单内容搜索- DeepSeek

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

8514 点击 2025-11-30 09:30

AI安全新漏洞：一首诗就能攻破顶级大模型？

如果你想恶意攻击一个大语言模型（LLM），比如 Gemini 或者 Deepseek，你会怎么做？

来自主题: AI资讯

6491 点击 2025-11-24 10:44

3B Image Captioning小钢炮重磅来袭，性能比肩Qwen2.5-VL-72B

今天推荐一个 Dense Image Captioning 的最新技术 —— CapRL (Captioning Reinforcement Learning)。CapRL 首次成功将 DeepSeek-R1 的强化学习方法应用到 image captioning 这种开放视觉任务，创新的以实用性重新定义 image captioning 的 reward。

来自主题: AI技术研报

10154 点击 2025-10-29 10:24

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

年初的 DeepSeek-R1，带来了大模型强化学习（RL）的火爆。无论是数学推理、工具调用，还是多智能体协作，GRPO（Group Relative Policy Optimization）都成了最常见的 RL 算法。

来自主题: AI技术研报

7215 点击 2025-10-23 11:41

一个关键词 18 万 ! AI 搜索已经被这帮人玩坏了

昨天晚上闲着没事,想在 DeepSeek 搜一下 AI 博主有哪些可以学习的。结果没想到,搜索结果里竟然出现了我自己。内心 OS:祖坟冒青烟了,妈妈我出息了,我被 AI 认证了,以后简历可以写被

来自主题: AI资讯

9997 点击 2025-10-22 10:10

DeepSeek 再开源：发布 3B MoE OCR 模型，视觉压缩高达20倍

刚刚，DeepSeek 推出了全新的视觉文本压缩模型 DeepSeek-OCR。该模型最大的突破在于极高的压缩效率： 20 个节点每天可处理 3300 万页数据，硬件要求仅为 A100-40G。

来自主题: AI资讯

12180 点击 2025-10-20 16:30

简简单单来个DeepSeek-V3.2-Exp 大解剖～附case评测

家人们，就在国庆放假前的今天凌晨，那个总在节前“搞事”的 DeepSeek，又双叒叕深夜悄然上线了！讲真，DeepSeek 是真的不考虑我们媒体人的死活啊哈哈！每次都卡着放假前更新，之前大家都转发的吐槽截图，本人又翻出来了：

来自主题: AI技术研报

9699 点击 2025-10-03 00:01

节前重磅：开源旗舰模型新SOTA，智谱GLM-4.6问世

昨天，深度求索刚刚开源 DeepSeek-V3.2-Exp。今天，另一国产大模型之光智谱 AI 也正式发布了旗下新一代旗舰模型 GLM-4.6，刚好撞车 Claude Sonnet 4.5。但有一点不同，智谱的 GLM-4.6 会继续开源，它即将上线 Hugging Face、ModelScope 等平台，遵循 MIT 协议。

来自主题: AI资讯

9830 点击 2025-10-01 11:46

Seko AI 想要重新定义短片创作这件事

在今年 3 月 DeepSeek 和豆包占领国内产品月活用户增速前两名的时候，以第三姿态紧随其后的，是红果短剧。两者之间这个巧合的「偶遇」，意外也不意外。反映的正是我们当下经历的最重要的技术与文化浪潮。

来自主题: AI资讯

8190 点击 2025-09-30 16:29

一家营收千亿美元的公司，如何回应 AI 落地的策略问题

2025 年 9 月 19 日，亚马逊云科技官宣：Qwen3 和 DeepSeek v3.1，首次上线 Amazon Bedrock ，正式对外提供服务，再一次引起了全球生成式 AI 市场对 Amazon Bedrock 这一产品的关注。

来自主题: AI资讯

8310 点击 2025-09-23 15:07